语音交互 - 智狐AI导航

Moshi

Moshi是一款由法国Kyutai实验室开发的端到端实时音频多模态AI模型，具备听、说、看的能力，并能模拟70种不同的情绪和风格进行交流。Moshi具有多模态交互、情绪和风格表达、实时响应低延迟、语音理解与生成、文本和音频混合预训练以及本地设备运行等特点。它支持英语和法语，主要应用于虚拟助手、客户服务、语言学习、内容创作、辅助残障人士、研究和开发、娱乐和游戏等领域。

AI项目与工具 2025年06月12日 73 点赞 0 评论 866 浏览

飞船 Kraft

飞船 Kraft 是一款由快手开发的AI智能对话应用，支持自然语言对话、个性化虚拟角色创建、内容创作辅助等功能。用户可通过飞船 Kraft 进行信息查询、日常生活助手、学习辅助及内容创作等活动。该应用还支持高度定制化和语音交互功能。

AI项目与工具 2025年06月12日 84 点赞 0 评论 565 浏览

Gemini Live

Gemini Live是一款由谷歌开发的智能语音助手，拥有自然语言理解和多模态识别能力，支持语音、图像和视频交互。其主要功能包括自然语言对话、多模态识别、个性化语音选择、任务自动化以及智能打断和续接。此外，Gemini Live还与谷歌的原生应用深度集成，提升用户体验。目标用户包括商务人士、技术探索者、多语言用户、创意人士和老年人。

AI项目与工具 2025年06月12日 13 点赞 0 评论 908 浏览

度豆

度豆是一款由百度开发的AI社交应用程序，用户可以通过文字、语音或图片与AI数字人进行交流，享受个性化的聊天体验。每个AI数字人都具备独特的人格和背景故事，能够提供百科全书式的知识解答、生活建议以及情感支持。该应用适用于日常聊天、信息查询、学习辅导、语言练习、休闲娱乐和生活助手等多种场景。

AI项目与工具 2025年06月12日 37 点赞 0 评论 705 浏览

Mini-Omni 是一个开源的端到端语音对话模型，具备实时语音输入和输出的能力，能在对话中实现“边思考边说话”的功能。模型设计无需额外的自动语音识别（ASR）或文本到语音（TTS）系统，直接进行语音到语音的对话。Mini-Omni 采用文本指导的语音生成方法，通过批量并行策略提高性能，同时保持了原始模型的语言能力。它支持实时语音交互、文本和语音并行生成、跨模态理解等功能，适用于智能助手、客户服务

AI项目与工具 2025年06月12日 93 点赞 0 评论 965 浏览

Insighto.ai

Insighto.ai是一个基于人工智能的通信平台，支持多语言对话、24/7客户支持及跨渠道互动。其核心功能包括语音和文本交互、个性化客户体验、CRM集成以及无代码构建能力，广泛应用于客户服务、销售、预约管理等领域，助力企业提升运营效率和客户满意度。

AI项目与工具 2025年06月12日 15 点赞 0 评论 673 浏览

Westlake

Westlake-Omni是西湖心辰推出的一款开源中文情感端到端语音交互大模型，融合了语音识别、自然语言处理、情感理解和对话管理等功能，具备实时性和端到端交互特性。它通过深度学习技术和离散表示法，实现从语音输入到语音输出的全流程自动化，生成自然流畅的语音回应，并广泛应用于智能助手、客户服务、教育辅助、健康医疗等领域。

AI项目与工具 2025年06月12日 91 点赞 0 评论 712 浏览

Voiceflow

Voiceflow 是一款面向非技术用户的无代码对话式 AI 平台，具备直观的拖放界面和强大的自然语言处理能力。它支持复杂对话流程的设计、多渠道部署及团队协作，适用于客户服务自动化、虚拟助手开发、语音交互系统构建等多个领域，为企业和个人提供灵活且高效的解决方案。

AI项目与工具 2025年06月12日 21 点赞 0 评论 826 浏览

CleanS2S

CleanS2S是一款流式语音到语音交互智能体原型，通过集成自动语音识别（ASR）、大型语言模型（LLM）、文本到语音（TTS）以及WebSockets等技术，提供高质量、实时的语音交互体验。它支持全双工交互和打断功能，可整合网络搜索和RAG模型以增强回答能力，适用于客户服务、智能家居控制、教育辅助、健康咨询及车载系统等多个领域。

AI项目与工具 2025年06月12日 99 点赞 0 评论 804 浏览

ChatGPT Windows客户端

ChatGPT Windows客户端是一款为Windows用户打造的桌面应用程序，支持快捷键调用、截图发送、文件上传、图片拖拽、对话搜索及语音交互等功能。它旨在提升用户的工作效率，涵盖学术研究、编程开发、内容创作、客户服务和语言学习等多个领域。目前处于测试阶段，未来将全面开放。

AI项目与工具 2025年06月12日 50 点赞 0 评论 592 浏览

语音交互

首页

语音交互

列表

默认

浏览次数

发布日期